数据革命对数据驱动的解决方案产生了巨大的需求。这一要求推动了越来越多的易于使用的工具和培训为有抱负的数据科学家提供,从而可以快速地构建预测模型。如今,无需详细的计划和验证即可轻松建造和部署数学破坏武器。这迅速扩大了AI失败的清单,即导致财务损失甚至违反民主价值(例如平等,自由和正义)的部署。围绕模型开发的计划,规则和标准缺乏,导致AI的无政府状态。此问题是在不同名称的情况下报告的,例如验证债务,可重复性危机和缺乏解释性。揭示了在模型开发或数据获取早期阶段犯的错误。因此,我们不再治愈部署有害模型的后果,而是通过将更多注意力提早地关注初始计划阶段来防止它们。在本文中,我们建议一个快速简单的框架来支持AI解决方案的规划。POCA框架基于四个支柱:性能,不透明,后果和假设。它有助于设置期望并计划在建立任何模型和任何模型之前的AI解决方案的约束条件收集了任何数据。借助POCA方法,可以为模型构建过程定义初步要求,以便昂贵的模型错误指定错误可以尽快甚至避免使用OR。 AI研究人员,产品所有者和业务分析师可以在构建AI解决方案的初始阶段使用此框架。
translated by 谷歌翻译
机器学习方法可以检测变量之间的复杂关系,但通常不利用域知识。这是一个限制,因为在许多科学学科(例如系统生物学)中,域知识以图形或网络的形式获得,并且其使用可以改善模型性能。我们需要在许多研究领域中使用广泛且适用的基于网络的算法。在这项工作中,我们使用具有固有的可解释性的新型贪婪决策森林来证明基于多模式节点特征的子网检测。后者将是保留专家并获得对这种算法的信任的关键因素。为了展示一个具体的应用示例,我们专注于生物信息学,系统生物学,尤其是生物医学,但是提出的方法也适用于许多其他领域。系统生物学是统计数据驱动的机器学习能够分析大量多模式生物医学数据的一个很好的例子。这对于达到精密医学的未来目标很重要,在该目标中,患者的复杂性是在系统层面上建模的,以最佳量身定制医疗决策,健康实践和疗法。我们提出的方法可以帮助揭示从多词数据数据的引起疾病的网络模块,以更好地了解诸如癌症之类的复杂疾病。
translated by 谷歌翻译
已经开发了许多方法来了解复杂的预测模型,并将高期望放在事后模型的解释性上。事实证明,这样的解释不是强大的,也不值得信赖,可以被愚弄。本文介绍了用于攻击部分依赖性(图,配置文件,PDP)的技术,这些技术是解释对表格数据训练的任何预测模型的最流行方法。我们展示了可以以对抗性方式操纵PD,这令人震惊,尤其是在可审核性成为支持黑盒机器学习的必备特征的财务或医疗应用中。欺骗是通过中毒数据使用遗传和梯度算法在所需方向弯曲和移动解释的。我们认为,这是使用遗传算法来操纵解释的第一项工作,这是可以转移的,因为它可以概括这两种方式:以模型 - 不合Stic和一种解释 - 不合Snostic的方式。
translated by 谷歌翻译
The number of standardized policy documents regarding climate policy and their publication frequency is significantly increasing. The documents are long and tedious for manual analysis, especially for policy experts, lawmakers, and citizens who lack access or domain expertise to utilize data analytics tools. Potential consequences of such a situation include reduced citizen governance and involvement in climate policies and an overall surge in analytics costs, rendering less accessibility for the public. In this work, we use a Latent Dirichlet Allocation-based pipeline for the automatic summarization and analysis of 10-years of national energy and climate plans (NECPs) for the period from 2021 to 2030, established by 27 Member States of the European Union. We focus on analyzing policy framing, the language used to describe specific issues, to detect essential nuances in the way governments frame their climate policies and achieve climate goals. The methods leverage topic modeling and clustering for the comparative analysis of policy documents across different countries. It allows for easier integration in potential user-friendly applications for the development of theories and processes of climate policy. This would further lead to better citizen governance and engagement over climate policies and public policy research.
translated by 谷歌翻译
Insufficient image spatial resolution is a serious limitation in many practical scenarios, especially when acquiring images at a finer scale is infeasible or brings higher costs. This is inherent to remote sensing, including Sentinel-2 satellite images that are available free of charge at a high revisit frequency, but whose spatial resolution is limited to 10 m ground sampling distance. The resolution can be increased with super-resolution algorithms, in particular when performed from multiple images captured at subsequent revisits of a satellite, taking advantage of information fusion that leads to enhanced reconstruction accuracy. One of the obstacles in multi-image super-resolution consists in the scarcity of real-world benchmarks - commonly, simulated data are exploited which do not fully reflect the operating conditions. In this paper, we introduce a new MuS2 benchmark for super-resolving multiple Sentinel-2 images, with WorldView-2 imagery used as the high-resolution reference. Within MuS2, we publish the first end-to-end evaluation procedure for this problem which we expect to help the researchers in advancing the state of the art in multi-image super-resolution.
translated by 谷歌翻译
与经典的统计学习方法相比,机器和深度学习生存模型表现出相似甚至改进事件的预测能力,但太复杂了,无法被人类解释。有几种模型不合时宜的解释可以克服这个问题。但是,没有一个直接解释生存函数预测。在本文中,我们介绍了Survhap(t),这是第一个允许解释生存黑盒模型的解释。它基于Shapley添加性解释,其理论基础稳定,并在机器学习从业人员中广泛采用。拟议的方法旨在增强精确诊断和支持领域的专家做出决策。关于合成和医学数据的实验证实,survhap(t)可以检测具有时间依赖性效果的变量,并且其聚集是对变量对预测的重要性的决定因素,而不是存活。 survhap(t)是模型不可屈服的,可以应用于具有功能输出的所有型号。我们在http://github.com/mi2datalab/survshap中提供了python中时间相关解释的可访问实现。
translated by 谷歌翻译
语言模型偏见已成为NLP社区的重要研究领域。提出了许多偏见技术,但偏见消融仍然是一个未解决的问题。我们展示了一个新颖的框架,用于通过运动修剪来检查预训练的基于变压器的语言模型的偏见。给定模型和一个偏见的目标,我们的框架找到了与原始模型相比,偏差少的模型子集。我们通过对模型进行修剪来实现我们的框架,同时将其按照歧义目标进行微调。优化仅是修剪分数 - 参数以及模型的权重,该参数充当门。我们尝试修剪注意力头,这是变形金刚的重要组成部分:我们修剪正方形块,并建立了一种修剪整个头部的新方法。最后,我们使用性别偏见证明了我们的框架的用法,并且根据我们的发现,我们提出了对现有辩论方法的改进。此外,我们重新发现了偏见 - 绩效权衡:模型执行越好,其包含的偏见就越多。
translated by 谷歌翻译
预期的目标提供了对球队和球员表现的更具代表性的衡量标准,这也适合足球的低分性质,而不是现代足球比赛。比赛的得分涉及随机性,并且通常不能代表球队和球员的表现,因此近年来使用替代统计数据(例如目标,球控球和钻探)是很受欢迎的。为了衡量射击的可能性是预期目标的目标,使用了一些功能来训练基于事件并跟踪足球数据的预期目标模型。这些功能的选择,数据的大小和日期以及可能影响模型性能的参数。使用黑框机器学习模型来提高模型的预测性能,可降低其可解释性,从而导致可以从模型中收集的信息丢失。本文提出了一个准确的预期目标模型,该模型由2014 - 15年至2020 - 21年欧洲前五名的欧洲足球联赛的七个赛季中的315,430张训练。此外,通过使用可解释的人工智能工具来获取可解释的预期目标模型来评估团队或球员性能。据我们所知,这是第一篇论文,该论文展示了可解释的人工智能工具汇总配置文件的实际应用,以解释一组观察结果,以进行准确的预期目标模型,以监视团队和球员绩效。此外,这些方法可以推广到其他运动分支。
translated by 谷歌翻译
生态系统抵御气候变化的稳定性和能力与其生物多样性直接相关。死树是整体森林健康的关键指标,住房三分之一的森林生态系统生物多样性,占全球碳股的8%。它们被几个自然因素分解,例如,气候,昆虫和真菌。准确的检测和模拟死木群众是了解森林生态,碳循环和分解者至关重要。我们通过在能量最小化框架中将建立的卷积神经网络与新的主动轮廓模型组合,提出一种新的方法来构造从航天照片的死树的精确形状轮廓。我们的方法在检测到的死树联盟的精确度,召回和交叉口方面产生了卓越的性能准确性。这种改进的性能对于满足气候变化(以及系统的其他人为扰动),特别是监测和估算碳股衰减率,监测森林健康和生物多样性以及死木的整体影响从气候变化。
translated by 谷歌翻译
数据增强是自然语言处理(NLP)模型的鲁棒性评估的重要组成部分,以及增强他们培训的数据的多样性。在本文中,我们呈现NL-Cogmenter,这是一种新的参与式Python的自然语言增强框架,它支持创建两个转换(对数据的修改)和过滤器(根据特定功能的数据拆分)。我们描述了框架和初始的117个变换和23个过滤器,用于各种自然语言任务。我们通过使用其几个转换来分析流行自然语言模型的鲁棒性来证明NL-Upmenter的功效。基础架构,Datacards和稳健性分析结果在NL-Augmenter存储库上公开可用(\ url {https://github.com/gem-benchmark/nl-augmenter})。
translated by 谷歌翻译